프 로 시 저 호 출 을 가진 루 프 에 서 병 렬 성 추출 


요 약 


프로그램 수 행 시 간 의 대 부 분 이 루프 구 조 에서 소 비 되고 있기 때문에 루프 구 조 를 가진 순차 프 로 그 램 에서 
병 렬 성 을 추 출 하는 연 구 들이 많이 행해지고 있고 그 연 구 들 은 하 나 의 프 로 시 저 내 루프 구 조 의 변 환 에 치 중 되 
고 있다. 그러나 대 부 분 의 프 로 그 램 들은 프 로 시 저 간 잠 재 된 병 렬 성 을 가지고 있다. 본 논 문 에서는 프 로 시 저 
호 출 을 가진 루 프 에서 병 렬 성 추출 방 식 을 제 안 한 다. 프 로 시 저 호 출 을 포 함 하는 루 프 의 병 렬 화 는 대부분 
자 료 종 속 거 리가 14014000 형 태 의 코 드 에서만 집 중 되었다. 본 논 문 에서는 자 료 종 속 거 리 가 071010 코드, 
ㅁ 0040110070 코드 그리고 복 합 된 (6000016×%) 코 드 를 가진 프 로 그 램 에서 적용 가능한 알 고 리 즘 을 제 시 하 였으며, 
제 안 된 알 고 리 즘 과 1000 6*801100, 1000 6070000108 그리고 2 ㅠ 0000476 0100108 변 환 방 법 을 (:1 ㅅ ㅠ -13 뜨 로 
성능 평 가 하였다. 성 능 평가 결 과 는 제 안 된 알 고 리 즘 이 효 율 적 이라는 것을 보여준다. 
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1. 서 론 


현대 슈퍼 컴퓨터 구조적 개 선 의 주요 목 적 은 병 
렬 화 를 증 가 하는 것이다. 병렬 하 드 웨 어 의 능 력 은 그 
것을 탐 지 하기 위한 소 프 트 웨 어 의 능력 없이는 불가 
능하다. 이러한 요 구 에 주요한 과 제 는 병 렬 화 를 탐지 
하는 기 술 을 컴 파 일 러 에서 만들고 병 렬 화 를 강 화 하 
기 위한 변 환 을 수 행 하고 코 드 에서 종 속 성 을 최소화 
하는 것이다. 

프로그램 수 행 시 간 의 대 부 분 이 루프 구 조 에서 소 
비 되고 있기 때문에 순차 프 로 그 램 을 병렬 프로그램 
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으로 변 환 하는 연 구 들 이 루프 구 조 의 변 환 에 치 중 되 
고 있다. 그러나 루 프 에 프 로 시 저 호 출 을 포 함 하는 
경우, 많은 잠 재 적 인 병 렬 성 을 가지고 있으며 컴파일 
러 는 그 것 으 로부터 최 대 의 병 렬 성 을 추 출 하 기 를 원 
할 것이다. 

프 로 시 저 호 출 을 포 함 하는 루 프 의 병 렬 화 에 서 가장 
중요한 면 은 프 로 시 저 분 석 이다. 분석 없이 함 수 나 
서 브 루 틴 호 출 을 포 함 하는 루 프 는 병 렬 화 할 수 없 
다. 프 로 시 저 분 석 이 끝나면 그 정 보 를 가지고 프로 
시저 변 환 을 해 야 한다. 프 로 시 저 변 환 에 서는 최 대 의 
병 렬 성 을 추 출 하는 것이 목 적 이 다. 프 로 시 저 호 출 을 
포 함 하 는 루 프 의 병 렬 화 는 대부분 자 료 종 속 거 리 가 
40101 형 태 의 코 드 에서만 집 중 되었다. 그러나 대 


부 분 의 프 로 그 램 들은 자 료 종 속 거 리 가 ㅁ 00 ㅁ 41107 
이다. 자료 종속 거 리 가 200 ㅁ 04010 인 경 우 는 컴 파 
일 시 간 에 병 렬 성 을 추 출 하는 것은 어렵다. 왜 냐 하 
면 , 자료 종속 거 리 가 ㅁ 004041[010 인 경 우 에는 자료 
종속 거 리 를 컴파일 시 간 에 알기 어 렵 기 때 문 이 다. 
이러한 이유로 자료 종속 거 리 가 200 ㅁ 401【01 인 경우 
에 컴파일 시 간 이 아닌 실행 시 간 에 병 렬 성 을 추 출 하 
고 있다. 실행 서 간 에 병 렬 성 을 추 출 해 서 병 렬 로 실 
행하는 것은 실행 시 간 이 길 어 진 다. 

본 논 문 에서는 프 로 시 저 호 출 을 가진 루 프 에 서 자 
료 종 속 거 리가 4001 코드, 2001401[0771 코드 그리 
고 복 합 된 (6001016%) 코 드 를 가진 프 로 그 램 에 서 적용 
가능한 병 렬 성 추출 알 고 리 즘 을 제 시 한 다. 본 논 문 에 
서 제 시 한 방 법 은 프 로 시 저 내 변환 방법 중 가장 
효과적인 방 법 인 자료 종 속 성 제거 방 법 [16] 을 확장 
하여 프 로 시 저 간 변환 방 법 에 적 용 하는 방 법 이다. 
이를 위하여 프 로 시 저 간 변환 방 법 인 1014 ㅁ 1208 확장 
변환 방 식 을 적 용 하고, 확 장 된 자료 종 속 성 제거 방 
법 을 적 용 하는 방 법 이다. 성 능 평 가는 제 안 된 알 고 리 
즘 과 프 로 시 저 간 변환 방법 중 성 능 이 우수한 방 법 으 
로 알려진 1000 6%0 ㅁ 80000, 1000 000060010@ 그리고 
ㅁ 0『0060416 0100108 변환 방 법 을 (114&-73 로 비교 
하였다. 그리고 제 안 된 알 고 리 즘 이 효율적인 방 법 이 
라는 것을 보여준다. 

본 논 문 의 구 성 은 2 장 에서 프 로 시 저 분 석 과 변환 
을 서 술 하 였고 3 장 에서는 프 로 시 저 호 출 을 가진 루 
프 에서 자 료 종 속성 제거 방 법 을 이용한 병 렬 성 추출 
알 고 리 즘 을 제 시 하 였다. 4 장 에서는 성 능 분 석 을 하고 
5 장 에서 결 론 을 서 술 한다. 


2. 프 로 시 저 분 석 과 변환 


프 로 시 저 분 석 은 프 로 시 저 내 분 석 과 프 로 시 저 간 
분 석 으로 구 분 하고 프 로 시 저 변 환 도 프 로 시 저 내 변 
환 과 프 로 시 저 간 변 환 으 로 구 분 한 다 [9,14]. 


2.1 프 로 시 저 내 분석 


프 로 시 저 내 분 석 이란 한 프 로 시 저 내 에 서 의 자료 
흐 룸 이나 제어 흐 름 에 관한 정 보 를 분 석 하 는 것을 
말한다. 프 로 시 저 내 분석 방 법 은 프로그램 문장 사 
이의 순 행 순서, 변수 값 도달 정의 탐색, 상수 전달, 
유 도 변수, 복사 전파, 공통 부분 식 , 불필요한 코드 
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제거, 코드 이동, 식 의 연산 순서 변경, 중 복 된 로 드 와 
저장 명령문 제거, 불필요한 14002 제거, 레지스터 할 
당 동이 있 다 [10,151. 


2.2 프 로 시 저 간 분석 


프 로 시 저 간 분 석 은 프 로 시 저 사 이 의 호 출 / 피 호 
출 관 계 에 나타나는 자 료 의 흐 름 에 관한 분 석 을 말한 
다. 프 로 시 저 간 분 석 을 하기 위해서는 먼저 각 프로 
시저 사 이 의 호 출 / 피 호출 관 계 를 나타내는 호출 그 
래 프 롤 작 성 하고 이를 이 용 하 여 프 로 시 저 간 자 료 의 
흐 름 을 분 석 하 게 된다. 각 프 로 시 저 사 이 에 자 료 가 
전 달 되는 경 로 는 형식 인 자 와 실 인 자 사 이 의 바인딩 
과 전역 변 수 에 의해 이 루 어 지 므로 인 자 들 사 이 의 
자료 흐 름 을 나타낼 수 있는 바 인 덩 그 래 프 를 사 용 하 
여 바 인 덩 과 전역 변 수 에 의한 자 료 의 흐 름 을 분 석 한 
다. 그리고 이명 관계, 상수 전달, 참조 정보 등 을 분 
석 한 다 [1.2.4.51. 


2.3 프 로 시 저 내 변환 


프 로 시 저 내 에 서 사 용 되 는 변환 방 법 으로 루프 분리 
(0000 0967600800), 루프 융 합 ([6020 809100), 루프 반 
전 (1.000 ㅁ 676182!), 쿠프 왜 곡 ([.000 5166\108), 루프 
교 환 ([.000 411(61013086), 루프 타 일 링 (000 11106) 등 
의 변환 방 법 이 있 다 [81113]. 

본 논 문 에서는 프 로 시 저 내 변환 방법 중 자 료 종 
속성 제거 방 법 을 이 용 하 므 로 자 료 종 속 성 방 법 에 대 
해서 간 단 하게 서 술 한다. 

병 렬 성 을 추 출 하기 위한 자료 종 속 성 제거 방 법 에 
서 종 속 성 행렬 100 .(6(1)606006006 1[2111% \141 016 
0 ㅁ 01066 아 ㅁ 466160 12000, 016 ㅁ 04001066 0 <07000 바 0020, 
300 16 041006067 아 868[620600) 는 자료 종 속 성 을 계 
산 하 기 위해 자료 종 속 성 을 표 현 하 는 정방 행 렬 이다. 
자료 종 속 성 제거 방 법 은 중첩 루 프 를 갖는 그림 21 의 
예 를 가지고 서 술 한 다 [161. 


1001=1, 제 
1000)90=1086 
옵 르 206-21-1) = 8044.31) + (0(44.54]1-2) 
욱 앗 2654.40) = 20-41-4) + 806-4341) + 0(341-1.441-2) 
00765649) = 20-5.1-3) + 80-21-3) + 001-11-2) 
1000.00) 
1200.00) 


그림 2.1 두 개의 중첩 루 프 룰 갖는 예 


272 멀 티 미 디 어 화 회 논문지 제 4 권 제 3 호 (2001. 6) 


그림 2.1 은 2 개 의 중 첩 된 루 프 를 가졌고 루프 안에 
있는 문 장 의 개 수 는 3 이 다. 이에 대한 종 속 성 행 렬 의 
초기 상 태 는 1/41Ｌ08(2.1.3) 이 다. 여기서 변수 # 의 
경우 문장 5> 에 서 문장 53 으 로 가는 흐름 종 속 이 존 
재 한 다. 이 경 우 에 자료 종 속 성 은 541" 와 /"-2 의 값 이 
같 아 지 는 정수 해 /< 7^" 의 값 을 구해야 하고 44/“ 와 
./^-3 의 값 이 같 아 지 는 정수 해 ./< ./" 값 을 구 해 야 한 
다. 이에 대한 초기 해 는 1280068(21,.3) 행 렬 의 2 행 
3 열 에 나 타 내 어 진다. 

그림 2.1 의 1841.08(2.1,3) 은 그림 2.2 이 다. 


81 2 나 
은 0 @(0103391),(101.41)) @((0101.4801),0101.391)) 


521 (0804086)(083084)) ((0101.986)(083.084)) -((101.706) (1801.704)) 
53] (084087)(386486)) ((2023587)(1040200)) -((101.887)(101800)) 


그림 2.2 자료 종 속 성 행렬 매 / ㄴ (65(2,1,3) 


그럼 2.2 에 서 문장 5> 에 서 문장 5 으 로 자료 종속 
성 이 존 재 하고 초기 해 는 ((700,706/,(7&1,7@4)/) 이 며 
((2702,7007,(207,7@47/ 가 구 해 지는 과 정 과 의 미 는 다 
음 과 같다. 

먼저 문장 52 에 서 문장 58 으 로 종속 관 계 를 나타내 
는 2 행 3 열 의 순 서 쌍 원소 즉 ((020668.0290020),(020 ㅠ 
029”029023)) 은 문장 5> 의 변수 2(5*/,4*.// 와 문장 53 
. 의 변수 2(7-2./-39/ 의 첨자 값 이 모두 같은 경 우 를 
표 현 하는 것으로 06100180006 방 정 식 울 “ 이 용하여 구 
할 수 있다. 즉 이에 대한 0100000006 방 정 식 은 


5*1'=1-2 
4*]' =]"-3 


을 만 족 하 는 초기 정수 해 1 1", ./< ./" 을 구하는 
것으로 00080006 방 정 식 을 이 용 하 면 /< /" 은 각각 
1 과 7 이 되며 ./" ./" 도 1 과 7 이 된다. 또한 1, 7", ./" 
/^ 의 계수 0293 04289 28 102 은 각각 1, 5, 1, 4 가 됨을 
확인할 수 있다. 따라서 초기 정수 해 7 1", /" ./^ 는 
각각 028 023 085 20 에 대 웅 하 므로 2 행 3 열 의 순서 
쌍 원소 ((029016080200029),(029000290290629)) 는 ((7@ 
7,700),(707,794)) 으 로 표 현 된 다. 또한 위와 같이 구해 
진 순 서 쌍 의 집 합 이 갖는 의 미 는 다 음 과 같다. 즉 , 
((2702,700), (702,704)) = ((029006609.0200029), (020@0020 
0@85@29)) 가 되므로 종속 관 계 에 있는 문장 6; 와 문장 


59 은 1'=02=7, ./"=625=1 인 경우 문장 52 는 2(5.4) = 
42(-%-9)+2(-3.9)+ 42.2/ 가 되고 7"=62=7, /^= 
025 = / 인 경우 문장 55 은 (4949) =4(24)+2(65,4) 
+(6.6/ 가 되어 변수 2(5,4/ 에 의하여 종속 관 계 가 
존 재 함 을 알 수 있고, 이어서 종속 관 계 에 있는 문 
52 의 7" 와 ./" 의 중 가 치 가 각각 1 이 므로 /" = 020+144 
=4+1=2 ./"=6000+71428- 7+」』= 2 인 경우 문장 5> 는 
2(206/ =4(-2.-2) + 2(-2.6) + (<5,6/ 가 되고, 문장 
53 의 "과 ]" 의 중 가 치 는 각각 5 와 4 이 므로 /<^=/2 
+1049= ㅋ 7+6=72 ./"=0290+0= ㅋ 7+4 = 77 인 경우 문 
장 5$ 은 (%660=4(7.94/+2(7064)+ 0 77,9/ 가 되 
어 변수 2(20.6/ 에 의하여 종 속 관 계 가 존 재 함 을 알 
수 있다. 고로 중가 치 에 따라서 첨자 변 수 의 최종 치 
까지 종 속 관 계가 형 성 됨을 알 수 있다. 그러므로 ((7@ 
7, 7/00),(207, 704)) 는 문장 6> 에 서 문장 5 으 로 종속 
관 계 를 함 축 시켜 표 시 하고 있 음 을 알 수 있다. 

이러한 행 렬 의 계 산 을 이 용 하 여 자 료 종 속 성 을 계 
산 하 고, 프 로 그 램 올 수 행 하는 기 법 에 의해 자 료 종속 
성 을 제 거 하는 방 법 이다. 


2.4 프로시져 간 변환 


프 로 시 저 사 이 에 적 용 되는 변환 방 법 으 로 101017@ 
확장 변환 방 법 은 피 호출 프 로 시 저 의 문 장 들 을 프로 
시저 정 보 에 의하여 프 로 시 저 호출 위 치 에 모두 대체 
한 다 .-12000-0×\ ㅠ 80000 변 환 방 법 은 루 프 에 서 호 출 을 
가진 프 로 시 저 에서 피 호출 프 로 시 저의 루 프 를 프로 
시 저 의 호출 위치 외 부 로 이 동 하 는 방 법 이다. 1000 
6000600108 은 프 로 시 저 호 출 을 포 함 하 는 루프 헤더 
를 피 호출 프 로 시 저로 이 동 하 는 변환 방 법 이다. 
1170060016 0100108 은 프 로 시 저 가 여러 차례 호 출 될 
때 프 로 시 저 를 최적화 한 프 로 시 저로 복 사 하여 많은 프 
로 시 저가 호 출 하게 하는 변환 방 법 이 다 [3.6.7.121. 


3. 프 로 시 저 호 출 을 가진 루 프 에 서 자료 종속 
성 제거 방 법 을 이용한 병 렬 성 추출 


프 로 시 저 호 출 을 가진 루 프 에서 병 렬 성 추 출 을 하 
기 위하여 자료 종 속 성 제거 방 법 을 확장 하였다. 자 
료 종 속 성 제거 방 법 은 프 로 시 저 내 변환 방 법 이지만 
이를 프 로 시 저 호 출 을 가진 루 프 에 사 용 하기 위하여, 
프 로 시 저 간 변환 방법 중에서 1410408 방 법 을 사용 


하였다. 10108 방 법 을 자 료 종 속성 제거 방 법 을 적 
용 하 기 전과 적용한 후에 따라 결 과 가 달 라 짐 으로 
어느 방 법 이 효 율 적 인 지 성능 평 가 를 실 시 하 였다. 
10110108 후 최적화 방 법 은 호출 프 로 시 저의 호출 위 
치 들을 피 호출 프 로 시 저의 코 드 로 대 체 하는 10- 
110108 을 수 행 한 후 111176 된 코 드 를 프 로 시 저 내 변환 
방 법 을 사 용 하 여 최 적 화 하 는 방 법 이다. 최적화 후 
1014010@ 방 법 은 각 프 로 시 저 단 위 로 프 로 시 저 내 변 
환 방 법 으 로 최 적 화 한 후 1210108 을 제외한 프 로 시 
저 간 변환 방 법 으로 최 적 화 한 다. 

본 논 문 에서는 1110108 후 최 적 화 하 는 방 법 이 효율 
적 이 므로 4410108 후 자 료 종 속 성 제거 방 법 을 적 용 하 
는 알 고 리 즘 을 제 시 한다. 


< 알 고 리 즘 1> 

1. 호출 멀 티 그 래 프 작성 

2. 확 장 된 호출 그 래 프 (3480160(60 08311 8782010 로 
확장 

3. 프 로 시 저 간 정보 계산 

4. 종 속 성 분석 

5. \ ( 하 나 의 프 로 시 저 가 한번 이상 호 출 되 고 호 
출 매개 변수 값 이 변하지 않으면) 
114 6060 < 알 고 리 즘 3> 
6805 800 알고리즘 4> 

6. 중간 코 드 에 자료 종 속 성 제거 알고리즘 < 알 고 
리즘 2> 대입 병렬 코드 생성 


< 알 고 리 즘 2> 
1. 초기화 과정 
3 = 문장 수 
동적 기 억 장 소 배열 140&, 10543, 120840 선 언 
8\ = 0 
2. @400080006 방 식 계산 위해 6< ㅁ 계산 함수 호 
출 하 여 2855 ㅋ 1 인 5*6 크 기 의 2 차 원 종속 행렬 
1008 구 함 
1 (인덱스 변 수 가 같으면) 71141 16081006 
3. 중첩 루 프 의 인덱스 변 수 를 1, / 라 하고 최대치 ^//, 
인 경우 
01301 1 ㅁ 0848 행 렬 의 』, / 에 대하여 
때 (06606) > 200) | | (08000) > 200) 
71181 그 원 소 는 0 으 로 치환 
때 6\@ = 0 11181 1000 = 10513, 5\ = 그 
4. 2808 행렬 이 용 하 여 0 이 아 넌 모든 원 소 에 대해 
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10801 1 ] 에 대하여 때 (04 & 000 == 17 
그 버티 40400 
665 때 (00 & 100 ! ㅋ 1) 다 ㅠ 000404000 
566 00070!6 형 태의 0001 6, 문 장 으로 변환 

5. 때 똑같은 원 소 가 존 재 한다면 11184 하나만 
남겨 놓고 제거 

6. 때 모든 원소 = 0 71184 80 10 8 
50 0855 증 가 하기 위해 행 렬 의 곱 이 용 하 여 
6560" 크 기 의 종 속 행렬 
10046 = 10854 * 20008 계산 
285687++ 
10503 = 10546 
1866 10804 
트 지 21 

7. 60 10 3 

8. 변 형 된 문 장 을 제외한 모든 문 장 에 대해 00314 
, 문 장 으로 변환 


< 알 고 리 즘 3> 
/* 프 로 시 저 내 변환 먼저 적 용 하고 111408 을 제 
외 한 프 로 시 저 간 변환 적용 후 1010108 적용 
*/ 
{ 
1. 16068(( 각 프 로 시 저 가 최 적 화 될 때 까지) 
{ /* 프 로 시 저 내 변환 적용 * } 
2. 16068「(( 프 로 시 저 간 최 적 화 될 때 까지) 
{ /* 1080108 을 제외한 프 로 시 저 간 변환 적 
용 ※% } 
3. 1676066 100010810801 070@/ 로 10110108 적용 
} 


< 알 고 리 즘 4> 
/* 1010108 후 프 로 시 저 내 변환 적용 */ 
{ 
1. 7676066 100010910301 000@ 로 10110108 적용 
2. 76068(( 각 프 로 시 저가 최 적 화 될 때 까 지 ) 
{ /* 프 로 시 저 내 변환 적용 */ } 
} 


4. 성능 평가 


자료 종 속 성 거 리 가 200 ㅁ 40140410, 00702016※ 형 태의 
코 드 에 서는 현재 프 로 시 저 호 출 을 가진 루 프 에서 사 
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용 되 는 1000 0×0 ㅁ 80800 변 환 방법, 1000 800600108 변 
환 방법 그리고 ㅠ 0060476 0100108 변 환 방 법 과 같은 
프 로 시 저 간 변환 방 법 을 적 용 해서 병 렬 성 을 추 출 하 
기는 어 렵 기 때문에 본 논 문 에서는 자 료 종 속 성 거리 
가 401010 인 그림 4.1 예제 코 드 를 사 용 하여 자료 
종 속 성 제거 방 법 을 이용한 프 로 시 저 변환 알고리즘 
과 1000 60 ㅁ 8 ㅎ 04000 변 환 방법, 10020 6010600108 변환 방 
법 그리고 \00604176 01070108 변 환 방 법 과 비교 분석 
한다. 


0 으 0300712406 ㆍ 

1681 800, 70) 

106680 1 

06 1 = ㅋ 1, 10 
01 @(6@,1) 
094 (86, 다) 

60000 


800080077354 0, 1) 
1681 100, ㅁ ) 
10666 1, ] 
00 ) = 1, 100 

101, ])) = 100) + 
60000 


그림 4.1 자 료 종 속 성 거 리 : 42711011'7 


4.1 프 로 시 저 를 포함한 병 렬 코 드 의 성 능 평가 


프 로 시 저 를 포함한 코 드 의 최적화 알 고 리 즘 과 
1000 6×0 ㅁ 80000, 1000 60700600108 그리고 2006041@ 
이 00108 변 환 방 법 의 성 능 을 평 가 한 다. 


4.1.1 프 로 시 저 를 포함한 코 드 의 최적화 알 고 리 
즘 을 이용한 병 렬 코 드 

프 로 시 저 를 포함한 코 드 의 최적화 알 고 리 즘 은 자 
료 종 속 성 제거 방 법 을 이용한 프 로 시 저 변환 방 법 을 
적 용 하 여 병 렬 코 드로 변환 후 병 렬 로 수 행 한다. 그리 
고 자료 종 속 성 이 발 생 하지 않을 때 까 지 자료 종 속 성 
검 사 하여 자료 종 속 성 이 발 생 하면 자료 종 속 성 계산 
으로 자료 종 속 성 이 있는 데 이 터 를 찾아 다시 병렬 
수 행 한다. 그림 4.1 의 예제 코 드 를 프 로 시 저 를 포함 
한 코 드 의 최적화 알 고 리 즘 을 적 용 하여 병 렬 코 드로 
변 환 한 코 드 는 그림 4.22) 와 같다, 변 환 된 병렬 코드 
를 병 렬 로 수 행 하 고, 수 행 된 병렬 코 드 에서 자료 종 


속 성 이 발 생 하는 곳 에 는 잘못된 결과 값 을 가지게 
되므로 자료 종 속 성 검 사 를 하여 자료 종 속 성 이 발생 
하면 자료 종 속 성 이 발 생 하는 문 장 만 다시 병렬 수행 
한다. 그림 4.2 의 병렬 코 드 의 자료 종 속 성 은 두 번째 
문 장 의 "01+1, ]) 와 첫 번째 문 장 의 101 ]) 에 서 발생한 
다. 자료 종 속 성 이 발 생 하는 문 장 을 병 렬 로 수 행 한 
다. 자료 종 속 성 이 더 이상 발 생 하지 않으므로 그림 
4.1 예 제 코 드 의 최적화 알 고 리 즘 은 병렬 수 행 을 두 
번 수 행 한 다. 


ㅣ 5108800712306 


1621 80, 0) 

10686 1 ) 

20878] 00 1 = 그 , 끼 1 

20031 00 ] = 그, 폐 2 
101, 3) = 101, 1) + 
101, 1) =(0+1, 1) + 

600 208172016! 00 
600 08316 00 


20181186 00 1 = 2, 퍼 1 
20216 00 ] =, 피 2 
10, )) = 166 )) + 
600 208731161 00 
600 20813]! 00 


그림 4.2 최적화 알고리즘 


4.1.23 1000 6×3808070 변 환 방 법 을 이용한 병렬 
코드 


프 로 시 저 간 변환 방 법 인 1000 6× ㅁ 800007 은 루프 
에서 호 출 을 가진 프 로 시 저 에 서 피 호출 프 로 시 저의 
루 프 롤 프 로 시 저의 호출 위치 외 부 로 이 동 하 는 방법 
이다. 그림 4.1 예제 코 드 에 1000 6×0 ㅁ 800004 쓸 적용한 
코 드 가 그림 4.3(3) 코 드 이 고 병 렬 화 를 위해서 1002 
105100 변 환 방 법 과 1000 1016『 아 8080 변 환 방 법 을 적 
용 한 코 드 는 그림 4.300) 과 같다. 그림 4.306) 코 드 에 
서 호출 프 로 시 저 ?' 는 외부 루프 / 는 병 렬 로 수 행 하 
고 내부 루프 ; 는 순 차 적 으로 피 호출 프 로 시 저 들 
을 호 출 한 다. 

4.1.31.000 6000600108 변환 방 법 을 이용한 병렬 
코드 


프 로 시 저 호 출 을 포 함 하는 루프 헤 더 를 피 호출 
프 로 시 저로 이 동 하 는 변환 방 법 인 1000 6002600108 


808068007)848 ㅁ 800880071346 
1601 800, ㅁ ) 16801 800, ㅁ ) 
14668 1, )] 111666 1, ] 
00 1=1, 씨 206316 00 ] =, 피 
00 ] =, 피 2 00 1 = ㅋ 그, 피 1 
601 (6, 1 0) 091 (6, 1 0) 
60000 0901 @(6,+1, ]) 
00 ] = 그, 씨 2 60000 
081 066, 171, ]) 600 007016 00 
60000 
60000 50880071284 0(【(, 1, ]) 
1681 160, 2) 
5088007441 0(【, 1, 1) 140686 1] 
1681 160, ㅁ 0) 
10416860 1 ] {66 )) = 1) + 
1 1) = 10, 1) + 


(2) 1000 6×06820800 (6) 49100, 14661011808 후 병 렬 화 


그림 4.3 [600 6×1 ㅠ 80100 


을 그림 4.1 의 예제 코 드 에 적용한 후 병 렬 화 롤 위해 
1000 10660008086 변 환 방 법 을 적 용 하였다. 

변 환 된 병 렬 코 드 는 그림 4.4 와 같이 호출 프 로 시 
저 는 두 개 의 피 호출 프 로 시 저 @ 를 호 출 하고, 피 ㆍ 
호출 프 로 시 저 <) 는 외부 루프 / 는 병 렬 로 수 행 하고 


내부 루프 ; 는 순 차 적 으로 실 행 한다. 


5801300070408 308080071346 
때 400, 2) 1681 800, 0) 
10666 1 106686 1 

6001 (61 0801 (6, 2) 

001 @(@, 1+1) 081 (6, 타 1) 
8008680074 0(【, 1) 5008800784 06, 1) 
1681 100, ㅁ ) 1681 (6, 0) 

104668@ 1 ] 10686 14 ] 
00 1= ㅋ 1, 제 00806 00 ] = 1, 30 

00) = 001=1, 50 

1, 9) = 11, 1) + 고 1, 1) = 16 1) + 

60000 ' 60000 

60000 600 00116 00 


(3) 1.000 ㅁ 06000600108 (0) 14000 1006001808 후 병 렬 화 


그림 4.4 0600 600160600109 
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4.1.4 ㅁ 70000076@0100178 변 환 방 법 을 이용한 병 
렬 코드 


임의 프 로 시 저가 여러 차례 호 출 될 때 프 로 시 저 를 
최 적 화 한 프 로 시 저로 복 사 하여 많은 프 로 시 저가 호 
출 하 게 하는 변환 방 법 이다. 그럼 4.1 의 예제 코 드 를 
1000060416 이 00178 을 적용한 코 드 는 그림 4.5 와 같이 
피 호출 프 로 시 저 @ 에 서 병렬 가능한 문 장 과 불가능 
한 문 장 을 분 리 하 여 병렬 가능한 문 장 을 01006 프로 
시 저 로 복 사 한다. 그리고 호출 프 로 시 저 의 병렬 
루프 ) 내 부 에서 병렬 가능한 문 장 과 불가능한 문장 
을 따로 호 출 하 여 병 렬 성 을 중 가 시킨다. 


508007238 고 
16801 2000, 20) 
10466862 1 ] 


80880071 지 00060, 1 1) 
1681 100 0) 
16686 1 ] 


20036! 00 ] = 1, 2 
6811 01006, 1, 3) 
6811 @(@, 나 1, )) 
600 0031 린 00 


20011 00 1 = 1, 피 1 
11, 3) = 16 )) + 
600 003116 00 


5088007234 (6, 1 ]) 
1681 100, ㅁ ) 
10466806 14] 


00 1 =, 제 
101, 1) = 10, 1) + 
60000 


그림 4.5 『『00604[6 이 01109 
4.1.5 성능 분석 

프 로 시 저 를 포함한 병 렬 코 드 의 성 능 평 가 는 프로 
시 저 를 포 함 하 는 코 드 에 서 기 존 에 사 용 하는 예 [7] 을 
사 용 하여 데이터 수 /; 은 20, 2/; 는 100 개 로 하고 프 
로 세 서 수 를 2 4, 6, 76, % 개 로 증 가 해 가면서 비교 
분석 하였다. 최적화 알 고 리 즘 은 자료 종 속 성 제거 
알 고 리 즘 을 이 용 하 여 병 렬 로 코 드 를 변환 후 자료 
종 속 성 이 없을 때 까지 병 렬 로 수 행 한다. 1000 6%- 
0 ㅁ 800004 과 1000 6000600108 이 같은 조 건 일 때, 1002 
600660010@ 을 선 택 하 는 것이 프 로 시 저 호출 오 버 헤 
드가 감 소 된 다. ㅁ 70060476 01020108 은 순 차 처 리 부분 
과 병 렬 처 리 부 분 의 프 로 시 저 를 따로 작성 후 병 렬 화 
를 최 대 화 시킨다. 성능 평가 결 과 는 그럼 4.6 과 같이 
자료 종 속 성 제거 방 법 을 이용한 최적화 알 고 리 즘 이 
병 렬 성 이 가장 크고 1000 6% ㅠ 80000 변 환 방 법 을 적 
용 한 병렬 코 드 가 가장 작 았 다. 
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수 행 시간 


러 즘 6000600109 
변 환 방법 


532 개 언 4 개 - #008 개 - ㅁ 164  8322 개 


그림 4.6 프 로 시 저 를 포함한 병렬 코 드 의 성 능 평가 


4.2 프 로 시 저 를 포함한 코 드 의 성능 평가 
매개 변수 값 이 호출 때 마 다 변하지 않는 그림 4.7 


의 예제 0401[01170, ㅁ 00140110117 그리고 00202016& 코드 
를 사 용 하 여 프 로 시 저 간 변환 방 법 을 비교해 보고, 
제 안 된 알 고 리 즘 을 적 용 하여 병렬 코 드 로 변환 후 
프로세서 증 가 하면서 성 능 평가 하였다. 

자료 종속 거 리 가 471【00 인 경 우 에 는 하 나 의 루프 
안에서 코드 변환 시 가장 많이 사용한 예 를 선택 변형 
하였다. 4000401[007 과 00702016× 는 제시된 예 제 가 없 
어서 [16] 에 서 제 시 한 예 제 를 선택 변 형 하였다. 


4.2.1 프 로 시 저 간 변환 방 법 의 성능 평가 


프 로 시 저 간 변환 방 법 인 .20 ㅁ 10108 확 장 과 100 ㅁ 6%- 
80000, 1000 .00060600108 변환 방 법 을 그림 4.7 예제 
코 드 를 사 용 하여 성 능 평 가 하였다. 그림 4.8 은 그림 
4.7 의 예제 코 드 (3) 의 결과 코 드 를 보여준다. 

10114108 확장 변환 방 법 은 프 로 시 저 호출 오 버 헤 
드 를 제 거 와 메모리 접 근 의 수 를 줄이고 다른 최적화 
를 가 능 하 게 한다. 여러 가지 변환 방법 중 간 단 하고 
효 율 적 이기 때문에 가장 많이 사용되고 있다. 그러나 
10114108 확 장 은 전역 지 역 에 적 용 하면 목적 코 드 와 
컴파일 시간 증 가 와 같은 문 제 가 발 생 되 므로 반복문 
내 부 와 같이 부분 지 역 에 적당한 변환 방 법 이다. 
0020 6×%\ ㅠ 80000 과 1000 0000600108 이 같은 조 건 일 
때, 1000 6010600108 을 선 택 하는 것이 프 로 시 저 호출 
오 버 혜 드가 감 소 된다. 변 환 된 코 드 를 성능 평 가 한 결 
과 는 그림 4.9 와 같이 수 행 시간 차 이 가 많아서 이중 
차 트 를 이 용 하 여 표 현 하였다. 세 가지 방법 모두 
10110108 확장 변환 방 법 이 가장 효 율 적 이었고 100 ㅁ 


?50660476 
1641 8(001,02), 6(01,02), 0001.02) 
1016860 1, ) 
00 1 = ㅋ 1, 01 
00 ] ㅋ 1, 702 
091 @ 
60000 
60000 


2 ㅁ 06601476 
1681 8001.02), 6(21,0 ㅁ 2), 0(01,.02) 
10166860 1 ] 
830, ]-7)=6(-1, ]-3)+6(1-9, ]+5) 
601+2, ]+18)=8(1-5, ]+4)+60+6, ]-4) 


(~ 
600+1, ]-6)0=8(1-6, 1+3)+6(-2, ]+3) 


(3) 07110720 


006601476 
1681 8001.02), 5(01.082), 0001.02) 
1041668@ 1 ] 

00 1 = 1, 4 

00 ] =, 02 

6034 @ 
60000 
60000 


200060076 02 

161 8001.02), 6( ㅁ 0122), 0(00 ㅁ 102) 

1066866 1 ] 
8(41, 51)=16(51, 21)+6(41, 61) 
16661, 41)=8(31, 21)+6(41, 31)+0(51, 31) 
0071, 51)=8(41, 31)+6(51, 31) 


(6) 띠 00140107220 


20006006 7 
1081 @(001.02), 6001.02), 6(21.22) 


200060076 

81 8001.02), 6(01,02), 여 22122) 

11668 1 } 

히 1-21 ]] = 미 44034]; 

미 54][644] = 하 34+3]1-4)] + 60-4][341] + 여 350[4 사 ; 
이 74054] = 411-5]1-3} 


(6) (60202016% 


그림 4.7 예제 코 드 || 


00660076 7 
76801 8(0041,0 ㅁ 2), 6(00 ㅁ 1, ㅁ 2), 0001.02) 
10668 1 ] 
00 1 ㅋ 1, 21 
060 ] ㅋ =, 0 ㅁ 2 
81, ]-7) = 6 
60+2, 1]+18) = 
00+1, ]-6) = 
60000 
60000 


책 


, )-3) + 60~9, ]+5) 
, 1+4) + 00+6, 1-4) 
, 3) + 60~2, ]+3) 


~-1 
80 
80 


-5 
6 


(3) 10110108 확장 


00060076 7 
1681 8001,02), 6(01,0 ㅁ 2), 0(0 ㅁ 102) 
10668 4 ] 
00 1 = 1, 피 

00 ] = 1, 02 

031 @ 

60000 

6 ㅇ 0000 


브 0006601056 02 

1631 8001.02), 6(001, ㅁ 2), 0(6 ㅁ 102) 

10668 1 ] 
30, ]-7) = 601, ]-3) + 60-9, ]1+5) 
6(0+2, ]+18) = 8(-5, ]+4) + 0(0+6, ]-4) 
60+1, ]-6) = 8(1-6, ]+3) + 60-2, ]+3) 


(6) 1.000 6× ㅁ ㅠ 80000 


브 00660076 < 
1681 8001.02), 60601,02), 0( ㅁ 1.02) 
031 @ 


ㅁ 000060056 
1681 8001.02), 6(01,0 ㅁ 2), 0001.02) 
10668 1 ] 
00 1 = 그 , 끄 
001 ㅋ 1 ㄴ , 02 
80, ]~7) = 00-1, ]-3) + 60-9, )+5) 
60+2, 1|+8) -5, ]|14) + 0076, ]-4) 
600+1, ]-6) -6, 113) + 60-2, ]+3) 
60000 


80 
8 


60000 
로 새 소 우구 사마 0 900 가 개수 재가 자 


(6) 1000 6026600108 
그림 4.8 421【0「11 형 태 코드 


6× ㅠ 80000 을 수 행 한 코 드 가 가장 비 효 율 적 임을 알 
수 있다. 

순차 코드 성능 분 석 의 결 과 와 같이 프 로 시 저 간 
변환 방법 중 1440108 확장 변환 방 법 이 가장 효율적 
인 변 환 방 법 이므로 본 논 문 에 서도 자료 종 속 성 제거 
방 법 을 확 장 하여 1140108 확장 변환 방 법 을 적용한 
프 로 시 저 변환 알 고 리 즘 을 제 안 하였다. 
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00040110007 
변 환 방 법 


222060110 이 00 009033 디 00100 …~@~…10110100 


그림 4.9 프 로 시 저 간 변환 방 법 의 성 능 평 가 


41100 6 ㅇ 001016× 


4.2.2 프로세서 수 중 가 에 따른 병렬 코 드 의 성 
농 평 가 
그림 4.7 예제 코 드 들을 종 속 성 제거 방 법 을 이용 
한 프 로 시 저 변환 알 고 리 즘 을 사 용 하 여 병렬 코 드 로 
변 환 하였다. 데이터 수 는 /, 은 20, ^4; 는 100 으 로 하 
고 프로세서 수 는 23 4, 8, 16, 32 개 를 사 용 하여 병렬 
코 드 를 성 능 평 가 를 하였다. 프 로 세 서 의 수가 중 가 하 
면서 성 능 이 좋 아 짐을 알 수 있었다. 그리고 프 로 세 
서 의 수 를 증 가 하 면서 성 능 평가 할 때 데이터 수가 
적은 것에 비해 프 로 세 서 를 수 를 많이 할 당 받 으면 
할 당 받 고 작 업 을 하지 않는 경 우 가 발 생 하 였다. 예 를 
들면 불변 종 속 거 리 인 경우 프로세서 32 개 를 할 당 받 
았을 때 21 개 의 프 로 세 서 만 사 용 하고 11 개 의 프 로 세 
서가 휴 지 상 태 (1016 56366) 가 발 생 했 다. 
프로세서 수 를 증 가 하면서 프로세서 수 증 가 에 따 
른 병렬 코 드 의 성 능 평 가 는 불변 종 속 거 리 형 태 가 가변 
종 속 거리 형 태 나 혼합 종 속 거 리 형 태 와 수행 시간 차이 
가 많이 나 므로 그림 4.10 과 같이 이중 차 트 를 이용하 
여 표 현 하였다. 


성 능 평 가 

이오 [호 0.001 
아커 부처 

버 90008 2 0.0007 
시 0.00006 10.225 ㄴ ㄴ ㄴㄴ 부서 
~ 0 
1 이 0 
00000 + 겼 2 ~ > 0.0002 
21.241.05 4 4.1: 어 


2] 
개 


8 
프로세서 수 


222 000401 아 마트 0000 디 68 29 니 110100 


그림 4.10 병렬 코 드 의 성능 평가 
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5. 결 론 


병 렬 처 리 에 서 루 프 가 전체 프로그램 실행 시 간 의 
대 부 분 을 차 지 하 기 때문에 하 나 의 프 로 시 저 에 서 루 
프 변환 방 법 에 대한 기 법 들 이 많이 제 안 되었다. 그 
러나 프 로 시 저 간 이 나 루프 내 부 에 프 로 시 저 를 포함 
하는 코 드 들 에 대한 병 렬 처리 연 구 는 많지 않다. 

본 논 문 에 서는 프 로 시 저 간 이 나 루프 내 부 에 프로 
시 저 를 포 함 하는 코 드 들 에 대한 병 렬 처 리 를 위한 최 
적화 알 고 리 즘 을 제 시 하였다. 그리고 프 로 시 저 를 병 
렬 처 리 하기 위하여 프 로 시 저 분 석 은 프 로 시 저 내 분 
석과 프 로 시 저 간 분 석 으로 구 분 하 여 서 술 하였고, 프 
로 시 저 변 환 도 프 로 시 저 내 변 환 과 프 로 시 저 간 변환 
으로 구 분 하 여 서 술 하였다. 

자료 종 속 성 거 리 가 200470101701, 0000016× 형 태의 
코 드 에 서는 현재 프 로 시 저 호 출 을 가진 루 프 에서 사 
용 되 는 1000 6×6 ㅁ ㅠ 80407 변 환 방법, 1000 000600108 변 
환 방법 그리고 ㅁ 0060476 0100108 변 환 방 법 과 같은 
프 로 시 저 간 변 환 방 법 을 적 용 해 서 병 렬 화 를 찾기 어 
렵 기 때문에 본 논 문 에 서는 4011070 형 태의 예제 코 
드 를 사 용 하여 자료 종 속 성 제거 방 법 을 이용한 프로 
시저 변환 알 고 리 즘 과 1000 6× ㅁ 30407 변 환 방법, 
1000 0060600178 변환 방법 그리고 2 ㅠ 0060476 0100178 
변환 방 법 과 비교 분 석 하 였다. 

매개 변수 값 이 호출 때 마 다 변하지 않는 경우 421- 
10070, ㅁ 00401【0020, 00170016× 코 드 를 사 용 하 여 프 로 시 
저 간 변환 방 법 을 비교해 보았고, 제 안 된 알고리즘 
을 적 용 하여 병렬 코 드 로 변환 후 프로세서 증 가 하 면 
서 성 능 평가 하였다. 

성 능 평 가는 자료 종 속 성 제거 방 법 을 이용한 프로 
시저 변환 알 고 리 즘 을 적용한 코 드 와 100 ㅁ 6%6830- 
1000, 1000 00060600108 그리고 ㅁ 2 ㅁ 00606 이 00108 변환 
방 법 을 적용한 예제 코 드 가 모두 프 로 시 저 변환 알고 
리 즘 을 적용한 코 드 가 가장 효 율 적 이었고 1000 6%- 
\ ㅠ 80000 을 수 행 한 코 드 가 가장 비 효 율 적 임을 알 수 
있었다. 

자료 종 속 성 제거 방 법 을 이용한 프 로 시 저 변환 
알 고 리 즘 은 전역 지 역 (10001 268) 에 적 용 하면 목 
코 드 와 컴파일 시간 중 가 와 같은 문 제 가 발 생 되므로 
반복문 내 부 와 같이 부분 지 역 (10001 & ㅁ 68) 에 적당한 


변환 방 법 이다. 
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